2023-07-14

INTRODUZIONE / Studio sulla performance dei giocatori di NBA

Come e quanto l’altezza di un giocatore di basket influenza:

  1. il ruolo giocato

  2. le prestazioni

DATASET

Raccolte pubbliche di dati dei giocatori NBA: https://basketball.realgm.com/nba

DATASET NEL DETTAGLIO

statistiche.txt (539 righe/giocatori, 22 colonne/Variabili)

  • mi concentro su:
    • Team, GP(Games Played), MIN (Minutes played), PTS(Total points),
    • FGM, FGA, FGP (Field goals: made, attempted, %),
    • TPM, TPA, TPP (Three-pointers: made, attempted, %),
    • FTM, FTA, FTP (Free throws: made, attempted, %),
    • ORB, DRB, REB (Rebounds: Offensive, defensive, total),
    • AST (Assists), STL(Stals), BLK (Blocks), TOV(Turnovers), PF(Personal fouls)

altezze.txt (539 righe/giocatori, 11 colonne /variabili): * 2 di interesse e non ridondanti con statistiche.txt: HT(Height) e POS(Position)

TIDYING / Modifiche sui dataset

  • trasformato i file .txt in fogli di calcolo .csv
  • rimosso variabili non rilevanti in altezze.csv
  • sostituito:
    • virgole (es: “1,000 -> 1000”; “A.J. Griffin, Jr.” -> “A.J. Griffin Jr.”)
    • “.000” -> “0”
    • numeri (es: 3PA -> TPA) / caratteri speciali (es: FG% -> FGP) con lettere nell’intestazione
  • importato i due fogli di calcolo, unendoli in un dataframe unico
  • convertito le altezze dal formato piedi.pollici in cm
  • sostituito le variabili “secche” con quelle in funzione del tempo giocato (es: PTS -> PTS/MIN)

CORRELAZIONI STATS-ALTEZZA / Pearson

ATTENDIBILITA’ (P-VALUE)

STATISTICA CORRELAZIONE P-VALUE
REB_MIN 0.45 3.24969076517268e-28
ORB_MIN 0.394 1.99289771686291e-21
DRB_MIN 0.39 5.09133800575558e-21
FGP 0.295 2.56173399104235e-12
BLK_MIN 0.261 7.1659945904272e-10
PF_MIN 0.23 6.6727377514345e-08
TPP -0.093 0.0310401505404618
STL_MIN -0.114 0.00799941089289065
TPM -0.146 0.000684334254032716
TPA -0.147 0.000633966136342602
AST_MIN -0.35 5.81819429915375e-17

CORRELAZIONI STATS-ALTEZZA / Kendall

ATTENDIBILITA’ (P-VALUE)

STATISTICA CORRELAZIONE P-VALUE
REB_MIN 0.355 3.43762675366146e-32
ORB_MIN 0.324 5.5777954115863e-27
DRB_MIN 0.321 1.58845361614298e-26
BLK_MIN 0.264 2.24577818961603e-18
FGP 0.234 8.23836495495729e-15
PF_MIN 0.186 5.78414999462638e-10
FTP -0.103 0.000650912085814258
TPA -0.105 0.000517667237779655
TPM -0.106 0.000503292116341192
STL_MIN -0.12 6.83634997115203e-05
AST_MIN -0.262 3.39568953239391e-18

SUDDIVISIONE IN QUARTILI

Q1) molto bassi: (175.3, 193.0]

Q2) bassi: (193.0, 198.1]

Q3) alti: (198.1, 203.2]

Q4) molto alti: (203.2, 223.5)

BUBBLEPLOT REB/MIN (cor.p: 0.45)

POSIZIONE (%)

BOXPLOT REB/MIN (cor.p: 0.45)

BUBBLEPLOT ORB/MIN (cor.p: 0.39)

BOXPLOT ORB/MIN (cor.p: 0.39)

BUBBLEPLOT DRB/MIN (cor.p: 0.39)

BOXPLOT DRB/MIN (cor.p: 0.39)

BUBBLEPLOT FGP (cor.p: 0.3)

BOXPLOT FGP (cor.p: 0.3)

BUBBLEPLOT BLK/MIN (cor.p: 0.26)

BOXPLOT BLK/MIN (cor.p: 0.26)

BUBBLEPLOT PF/MIN (cor.p: 0.23)

BOXPLOT PF/MIN (cor.p: 0.23)

BUBBLEPLOT STL/MIN (cor.p:-0.11)

BOXPLOT STL/MIN (cor.p:-0.11)

BUBBLEPLOT TPM (cor.p: -0.146) - TPA (cor.p: -0.147) - TPP (cor.p: -0.09)

BOXPLOT TPM (cor.p: -0.146) - TPA (cor.p: -0.147) - TPP (cor.p: -0.09)

BUBBLEPLOT AST_MIN (cor.p: -0.35)

BOXPLOT AST_MIN (cor.p: -0.35)

RIEPILOGO (CONTRIBUTI)

Le più evidenti correlazioni positive:

  • REB/MIN (cor.p: 0.45), ORB/MIN(cor.p: 0.39), DRB/MIN(cor.p: 0.39)
  • FGP (0.30)
  • BLK/MIN (cor.p: 0.26)
  • PF/MIN (cor.p: 0.23)

Le più evidenti correlazioni negative:

  • STL/MIN (cor.p: 11.7)
  • TPM (cor.p: -0.15), TPA(cor.p: -0.15), TPP(cor.p: -0.10)
  • AST/MIN (cor.p: -0.35)